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1. - LIMINAIRES 


l.l, - PRÉLIMINAIRES 


Cette Note Technique est la troisième abordant la description 
statistique des témoignages relatifs à des observations, de Phéno- 
mènes Aérospatiaux Non-identif iés (PAN) . Il nous a paru important 
de préciser les objectifs et limites de cette étude. Ces prélimi- 
naires auraient dû trouver leur place antérieurement à tout travail 
statistique, mais les deux raisons ci-dessous font que des précau- 
tions élémentaires doivent être constamment réévaluées au cours de 
l’analyse. 


POPULATION NON- IDENTIFIÉE : 


• La première est spécifique à la nature des données : les 
outils statistiques ont essentiellement pour objectif de décrire, 
résumer, tester les principaux paramètres d'une population, c'est- 
à-dire, par définition, d*un ensemble d* individus* présentant une 
ou des caractéristiques communes . 

On constate alors que la propriété commune à tous les individus 
définissant la population étudiée est négative** ï c’est la non — 
identification , par un témoin-observateur et dans un environnement 
particulier , de la cause de sa perception ; elle ne définit pas 
une classe particulière de phénomènes mais seulement un type de 
comportement ou de relations phénomène /observateur /environnement. 


♦Elément de la population 

**Les termes positifs de la définition sont : "phénomènes (ce 
qui est perçu par les sens) et "aérospatiaux" mais ils sont 
d’une telle généralité qu’ils n'apportent guère de précision. 
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RECHERCHE NON- \ KDËPENDANTE : 


• La deuxième raison concerne la conceptualisation du problème. 
D'une part le GEPAN, de par sa position et son rôle, est un facteur 
actif parmi l'environnement sociologique du "phénomène OVNI” (Cf. 
BESSE, ESTERLE, JIMENEZ - 81) ; d'autre part, son sujet de travail 
n'est pas vierge mais, comme toute recherche, il a été précédé par 
une série de travaux (Cf. Notes d'information 2, 3 et 4, Note 
Technique N a 3, chapitre 1) qui ont défini une dynamique de recher- 
che particulière avec ses propres concepts, discours, systèmes 
d'hypothèses et préjugés, par rapport auxquels il est nécessaire 
de se situer. 

D'un point de vue général, le GEPAN ne considère pas d'hypothèse 
globale explicative, il ne développe que des hypothèses ponctuelles 
et particulières aux situations concrètement rencontrées (Cf. Pla- 
quette GEPAN). Aussi du point de vue spécifique à l'étude statistique 
ceci nous conduit è reconsidérer 1 * héritage qui est constitué d'une 
part de la saisie et du codage des informations et d'autre part des 
P r ^- or ^^ 8 accordées aux différentes analyses participant de l'appro- 
che statistique. 


Le propos de ce travail est donc double : 

• Achever la description statistique du fichier des obser- 
vations recueillies par la Gendarmerie Nationale entre 1974 et 
1978, dans sa forme codée actuelle ; c'est la continuation des 
travaux entâmés dans les notes techniques 2 et 4 ; tous les cas 
sont maintenant codés. 

• Redéfinir une stratégie pour des études statistiques à 
venir. 


1 . 2 . - OBJECTIFS 


On premier travail statistique (BESSE 80) réalisé à partir du 
fichier de la Gendarmerie Nationale tentait de révéler les biais 
introduits dans la constitution des fichiers de données* Le tra- 
vail suivant (BESSE 81) insistait sur les liaisons témoins/phéno- 
mènes en faisant remarquer que deux approches et donc deux métho- 
dologies différentes doivent être développées suivant que l'on 
s'intéresse à la population des témoins ou encore à celle des phé- 
nomènes présumés. 
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I»e présent travail vise à décrire les caractéristiques globales de 
1* ensemble des phénomènes décrits dans les procès-verbaux de la 
Gendarmerie, tout en sachant bien que celles-ci ont été sévèrement 
filtrées par les témoins*. Les limites de cette recherche sont donc 
imposées par notre incapacité actuelle à pouvoir trier, parmi les 
caractéristiques relevées, celles dues au témoin, celles dues au 
phénomène-source, celles liées aux conditions d'observation ou en- 
core celles attribuables à d'éventuels stéréotypes sociaux**. 

D'autre part, compte tenu de l'imprécision avec laquelle est ca- 
ractérisée la population étudiée et de l'hétérogénéité de celle-ci 
(Cf. § 3), l'objectif principal est avant tout de rechercher une 
typologie des observations. Ce n'est que lorsqu'une répartition en 
classes suffisamment homogènes sera obtenue que l'on pourra envi- 
sager la recherche de modèles explicatifs pour chacune de celles- 
ci***. 


*11 aurait été certainement préférable de commencer par étudier 
les témoins et leur perception mais l'héritage est tel que... 

**Ceux-ci sont actuellement recherchés à l'aide d'un sondage 
(résultats à paraître) . 

***Dans la revue INFORESPACE (n" 4 hors-série, décembre 80) , on 
trouve un bon exemple montrant la nécessité d'une telle démar- 
che. Les auteurs y étudiant la corrélation entre la fréquence 
journalière des observations et la position du soleil trouvent 
celle-ci significativement élevée. Ils ne donnent que très peu 
de précisions sur la façon dont a été construit le fichier mais 
tout semble indiquer qu'aucune sélection n'y a été effectuée. 

Or (Cf. § 3.1.) les ballons sondes ou Vénus sont des sources de 
confusion très fréquentes qui ont lieu justement un peu avant ou 
après le coucher du soleil t Ceci suffirait peut-être à expliquer 
les pics importants observés dans les distributions journalières 
pour le fichier considéré et ainsi les corrélations calculées. 

En règle générale, il faut se méfier de ne pas attribuer à l'en- 
semble des observations les caractéristiques d'un sous-groupe 
homogène de celles-ci. 
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De nombreuses classifications ont déjà été proposées dans la litté- 
rature spécialisée (HYNECK - SAUNDERS* * , ) mais toutes, extrinsèques, 
ont été induites sur le corpus des données et reposent essentiel- 
lement sur un critère d* éloignement de l'observation tvoir de 
son "étrangeté"). Connaissant l'imprécision de cette estimation et 
l'importance que peut avoir l'environnement sur celle-ci, les 
classifications présentées semblent donc concerner beaucoup plus 
le témoin et les conditions d'observation que le phénomène supposé 
à l'origine de la description. 

^ résumé 1 objectif reste la recherche d'une typologie intrinsèque 
aux données en tenant compte "au mieux" des imprécisions et écueils 
signalés cl— dessus. Des éléments permettant d'élaborer une straté- 
gie de recherche plus rigoureuse visant à intégrer les aléas" du 
témoignage humain sont abordés au paragraphe 6* 


1.3. - INTRODUCTION 


Le fichier des procès-verbaux issus de la Gendarmerie est entière- 
ment codé pour les années 74 à 7.8 incluses à l'exception de quel- 
ques cas qui ont donné lieu à de très nombreux témoignages et qui 
seront traités à part. 

Dans le deuxième paragraphe, sont posés les problèmes concernant 
le codage des informations afin d'aboutir à une représentation 
de celles-ci excluant "au mieux" les difficultés rencontrées 
dans les travaux précédents. 

Le but du troisième paragraphe est alors de décrire la famille 
ites cas qui ont été identifiés a posteriori avant d'en esquisser 
une typologie. 

Dans le quatrième paragraphe, il s'agit de préciser la notion 
de "non-identification" en considérant d'abord chaque variable puis, 
globalement, en étudiant la répartition des cas restant non-identi- 
fiés dans la typologie précédente. 

Enfin, après une conclusion provisoire, une nouvelle approche de 
type probabiliste, fondée sur les résultats de l'annexe 3, est 
proposée afin d'adapter codage et analyses aux problèmes très 
particuliers que pose l'étude des phénomènes aérospatiaux non- 
identifiés. 
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2. - LES DONNEES 


2.1. - LES DONNÉES BRUTES 


Les informations brutes contenues dans les procès-verbaux de 
Gendarmerie ont été résumées à l'aide du codage détaillé par DUVAL 
79 (Cf. Annexe 1). Celui-ci, construit à partir de certaines idées 
a priori présente des défaillances (Cf. BESSE - 81) lorsqu’il est 
confronté à la réalité des procès-verbaux ou lors des analyses 
statistiques ; 

• Certaines variables ont été abandonnées car jugées à l’usage 
inutile, trop peu significatives ou trop empreintes de "subjecti- 
vité" : 

- type d'observation, 

- crédibilité, 

- intérêt, 

- longitude - latitude, 

- estimation de l’accélération, 

- direction azimutale. 

• D’autres apportent ces redondances préjudiciables à la 
rigueur des analyses (une même information, codée deux fois, prend 
une importance artificielle) î 

- description de la trajectoire et hauteur angulaire (station- 
nement près du sol, atterrissage...) (hauteur de 0 à 15") 

- description de la trajectoire (nulle puis lente, nulle puis 
rapide) et estimation de la vitesse (variable) . 

• Ou encore introduisent des modalités mutuellement exclusi- 
ves : 

- luminosité (principale et secondaire) , 

- trajectoire (principale et secondaire) , 

ainsi la linéarité de la trajectoire apparaît dans une variable 
(principale ou secondaire) mais évidemment jamais dans les deux. 

• Des modalités d'une même variable ne sont pas homogènes : 
estimation de la taille (métrique, angulaire, par comparaison) . 

• Certaines sont pléthoriques et d'autres vides : 

- Trajectoire : ligne droite ou courbe très ample - immobile 

ou ligne droite avec arrêts (70 %) 

objet pénétrant ou sortant de l'eau (1 cas) 
atterrissage puis décollage immédiat (2 cas) 
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2 . 2 . - CODAGE RÉVISÉ 


Les problèmes évoqués ci-dessus imposent: de reconsidérer le codage 
mais comme il serait trop coûteux de recoder tous les procès-verbaux, 
on se propose d'en limiter les conséquences en adaptant au mieux 
la structure des variables aux analyses à réaliser. Ceci nécessite 
donc le regroupement de certaines modalités et, pour ce faire, la 
connaissance des répartitions des observations dans les différentes 
variables. 

Les histogrammes représentés en Annexe 2 permettent ainsi d'éliminer 
les modalités trop peu fréquentes et on obtient finalement le codage 
ci-dessous qui sera utilisé lors des analyses factorielles décrites 
aux paragraphes suivants. 
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Estimation de 
l'heure 



Nature du lieu 


(nonbre de témoins 
potentiels) 


Nombre de témoins 


Catégorie socio-pro- 


cessionnelle du 


témoin principal 


[Xirée de l'observation 




Inconnue 
Matin 
Vers midi 
Après-midi 
Soirée 

Inconnue, Avion, 
Etranger 
Sud-Ouest 
Sud-Est 


Inconnue, autre 
Désert, haute monta 
gne, mer 

Habitation isolée 
Hameau petit villae 


7,08 

Juillet 

11,36 

Août 

11,80 

Septenbre 

5,60 

Octobre 

3,98 

Novenbre 

7,37 

Décenbre 

1,18 ! 

Crépuscule 

7,23 

Début nuit 

8,85 

Fin nuit 

6,93 

Vers minuit 

8,55 

Aurore 


Ouest 

2,66 

Nord 

14,31 

Est 

16,14 

Centre 

0,45 

Bourgade, Banlieu 

7,37 

Ville 

9,44 

Très grande ville 

40,71 



Inconnue 
Agriculteur et 
salarié agricole 10 , 82 

Patron ind. et ocmn. 7,42 
Prof. Libérale, 
cadre supérieur 10,82 

Cadre moyen , 11,56 


Inconnue 
Moins de 13 ans 
De 14 à 20 ans 


Masculin 


Inconnues 
Ciel llirpide 
Nuages épars 
Couvert en altitude 


Inconnue 
Moins de 10 s 
de 10 à 59 s 


2,22 

1,62 

11,37 


78,91 



Trois 

Quatre et + 



De 20 à 60 ans 
Plus de 60 ans 


Féminin 


Ciel bas sans pluie 
Pluie, neige 
Autre 


de 1 à 19 im 
de 20 à 59 nti 
1 heure et plus 


4,57 

4,13 

15,04 

25,66 

17,85 


14,64 

19,97 

22,46 

9,82 

21,39 

14,01 

6,64 


16,30 

28,44 


3.41 
17,77 

7.41 
20,27 


71,64 

13,15 


21,09 



37,78 

10,03 

9,00 
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timatlcn de la 



Caractéristl 


luninosi 


de la 


Inconnue 
en mètres 
en hectomètres 


Inconnue 
Oeil nu au sol 
Avec instrument 
Tracé physique 


Inconnue 
0/15 degrés 
15/30 degrés 
30/45 degrés 




Inconnue 

Disque, soucoupe 
Rond, circulaire, 
sphérique 
Cigare, cylindre 
Oeuf, ovale, ovoïde 
Conique, toupie 


Inconnue 

Ponctuelle 


Inconnue 
Non lumineux 
Lueur faible 


Variable non pérlod. 

Clignotant 

Avec faisceaux 


Linéaire 

Virages 

Arabesques 

Complexe nais analys 

Décollage 


46,59 

34,04 

0,94 


0,59 

66,66 

8,26 

2,36 


24,93 

15,86 

10,83 

12,46 


85,06 

8,14 


33,78 

13,42 

11,65 

5,90 


5,08 

11,15 

5,48 



Eh kilomètres 
Très grande dist. 


A bord d'un bateau 
Voiture en mouvement 
Voiture à l'arrêt 


45/60 degrés 
60/90 degrés 
VU d'avion 
Vu du sol 


Trois 

Quatre et plus 


Carré, parallélépipède 2,36 
Canotier, couronne 3,98 


7.12 

7.57 

0,59 

20,33 




Ponctuel 

Croix 

Croissant 

Autre 


Non ponctuelle 


Lumineux fluorescent 
Très lumineux 
Eblouissant 


3,24 

0,15 

0,15 

14,74 





Blanc 

Gris 

Métallique 
Plusieurs couleurs 
Couleur changeante 
Autre 
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Estimation de la 
vitesse 

Inconnue 
Lente, inrnobile 
Très rapide 
Fulgurante 

17,58 

41,95 

16,40 

4,58 

Carme un avion 

Variable 

Autre 

4,58 

12,70 

2,22 

Bruit 

Inconnu 

Silence 

Dans les gravas 

33,04 

58,11 

2,80 

I Dans les aigus 
Autre 

3,25 

2,80 
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REMARQUES : 


• Ces résultats concernent 678 cas sur cinq années <7 4 à 78) , 
aucune distinction n*a encore été faite sur les types (identifié a 
posteriori, non-identif ié . . . ) , 

• Les variables "luminosité principale et secondaire” ont été 
reconsidérées en une variable "intensité” et trois autres marquent 
la présence ou l'absence d'un caractère (variable, clignotant, 
faisceau) , 

• De même pour éviter les redondances possibles les variables 
"trajectoires principale et secondaire" sont remplacées par la pré- 
sence ou l'absence de 5 caractéristiques. 

• Les variables "estimation de la distance” et "estimation de 
la taille" sont très peu fiables. De plus, la taille est exprimée 
de façon très diverse (métrique, angulaire, qualitative, par compa- 
raison) , elles ont été simplifiées au maximum afin d'éviter une 
précision factice et donc une répartition ou dispersion non signi- 
ficative des observations dans ces classes de réponses. 

• La redondance entre "forme, ponctuelle" et "taille ponctuelle" 
difficilement évitable au niveau du codage sera écartée lors des 
analyses. 


2 . 3 . - CONCLUSION 


Les manipulations successives de l'information ne font qu'accroître 
1 ' entropie du système étudié. Seul un traitement statistique des 
textes des procès-verbaux "en clair" serait susceptible de minimi- 
ser les pertes et déformations des informations transmises par les 
témoins mais évidemment pour un coût nettement plus élevé. 


; 
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3. - LES CAS IDENTIFIES A POSTERIORI 


Avant codage, chaque procès-verbal de Gendarmerie reçu au GEPAN -a été 
expertisé par deux personnes qui classent le cas suivant qu*il peut 
être : 


A : explicitement identifié 
B : probablement identifié 
C : manque d'information 
D : non-identif ié 


23 cas 
153 cas 
239 cas 
263 cas 


3,4 « 
22,6 % 
35,3 « 
38,8 %* 


compte tenu du caractère limité de moyens mis en oeuvre, ces exper- 
tises ne peuvent être considérées comme objectives mais elles 
apportent une information supplémentaire ou plutôt un commentaire 
synthétique du procès-verbal; contrairement à la parcellisation 
systématique introduite par le codage. 


3.1. - RÉPARTITION 


Les 176 cas qui ont pu être explicitement identifiés (tel avion, 
telle fusée, telle planète. . .) ou qui l’ont été probablement (qui se 
comporte comme un avion, etc.) conduisent à des explications très 
variées : 


• Confusion avec des corps astronomiques : 

Lune, Soleil, Vénus ou autre planète, étoiles, satellites, 
rentrées de satellites, de météorites ; 

• Confusion avec des phénomènes atmosphériques naturels : 

Nuages lenticulaires, réflexion sur des nuages, traînées 
d’avion, gros grêlons ; 

• Ou encore des artéfacts : 

ballons sondes, avions, hélicoptères, fusées (météo, missiles, 
Tlber, éclairante ou d’artifice) cerf-volant, engin téléguidé, 
pétard, montgolfière, dirigeable publicitaire, incendie, 
effet couronne, phares... 


*Ce ne sont pas les 20 % traditionnemen t cités car le fichier 

considéré ici ne prend en compte qu’un témoin jugé "principal** 
par cas et il ne contient pas les cas de certaines rentrées de 
satellites ou météorites qui ont donné lieu à de très nombreux 
procès-berbaux . 
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• Ou enfin des associations de ces trois types : 
planète et avion, soleil et fusée... 


On remarque que parmi cette longue liste très éclectique certains 
phénomènes sont rares et peuvent surprendre un observateur non- 
averti (effet couronne sur une ligne électrique) mais que d'autres 
beaucoup plus banals, (lune, soleil, avion...), ont dû être obser- 
vés dans des conditions particulières (lune à l'horizon en partie 
cachée par des nuages...) (Voir croquis page suivante). 

Il est raisonnable de penser que cette liste est loin d'être close 
et cette hétérogénéité montre bien la nécessité de déterminer une 
typologie des témoignages pour définir de6 classes présentant un 
minimum de cohérence. 


3 . 2 . - DESCRIPTION SOMMAIRE 


En croisant la variable supplémentaire "Identification" avec les 
autres un certain nombre de celles-ci apparaissent comme plus dis- 
criminante t 

- mois d'observation 

- durée 

- estimation de la taille 

- luminosité 

- vitesse 

c'est-à-dire que ce sont ces variables qui permettent le mieux 
de distinguer les phénomènes les uns des autres et donc de les 
identifier. 

Les autres variables sont soit équiréparties suivant les types 
d'identification, soit trop "creuses" (information non disponible) 
ou encore trop monolithiques (la majorité des cas prennent la 
même modalité) , par exemple t 

trajectoire : linéaire - immobile 
estimation de l'heure : la nuit 


Le caractère discriminant de ces variables s'explique en fait par 
un certain nombre de rapprochements banals entre des modalités 
de ces variables et l'identification la plus 
souvent associée t 

VITESSE î rapide ou fulgurante pour les fusées et météorites. 
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DUREE t très brève, toujours pour les rentrées atmosphériques, 
très longue pour les planètes et étoiles. 

TAILLE s ponctuelle pour les étoiles et satellites. 

LUMINOSITE t les artéfacts sont le plus souvent non lumineux 
tandis que le soleil est plus lumineux que Vénus elle-même 
plus lumineuse que les autres planètes. 

MOIS D* OBSERVATION : 

27 % des confusions avec les avions ont lieu en septembre 

27 % des confusions avec des ballons sondes ont lieu en juin 

24 % des confusions avec les rentrées atmosphériques ont lieu 

en novembre 

36 % des confusions avec Vénus ont lieu en décembre. 

3.3. - REPRÉSENTATIONS FACTORIELLES 


Afin d'avoir une meilleure idée d'ensemble en tenant compte des 
liaisons entre les variables prises deux à deux, une analyse des 
correspondances multiple* a été réalisée et dont le résultat est 
illustré par les planches 1 et 2 ci-après. 

(al Sur la première planche ne sont représentées que les modalités 
des variables "actives" qui ont participé au calcul de l'ana- 
lyse. (recherche des axes factorielsl . Ces variables ont été 
choisies parmi les plUB discriminantes observées au paragraphe 
précédent (le mois d'observation peu interprétable a été écar- 
té) et en y adjoignant deux variables (distance et hauteur 
angulaire) dont 1 ' importance a été remarquée lors des travaux 
précédents sur les cas D. 

Le premier axe factoriel représente essentiellement la varia- 
ble "durée de l'observation", c?est-à-dire celle qui permet le 
mieux de distinguer entre eux les différents types d'observation. 
L'axe 1 est orienté dans le sens décroissant des durées. La 
variable "estimation de la vitesse" est également liée à cet 
axe. 


"Cette méthode d'analyse est sommairement décrite par BESSE -Bû. 
Se reporter également à la bibliographie citée. 
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Planché 
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Aux vitesses estimées très rapides et fulgurantes correspon- 
dent alors les durées les plus brèves, tandis qu'à l'autre 
extrémité de l'axe se trouvent représentées les modalités 
"lent, immobile" et "vitesse variable". On note de plus que 
c'est dans le cas d'observations très brèves qu'il manque le 
plus d* informations. 

Le deuxième axe illustre ou résume la liaison entre les varia- 
bles “estimation de la distance" et "hauteur angulaire", liai- 
son déjà soulignée précédemment (Cf. BESSE - 80) et à laquelle 
participe également la variable "estimation de la taille". On 
retrouve donc que, grossièrement, la distance estimée par le 
témoin croît avec la hauteur angulaire de l'observation à une 
nuance près : pour les sites les plus élevés (60° à 90°), la 
distance est le plus souvent non précisée. Un regroupement 
sommaire des modalités donne alors : 

- distance en mètres - vu au sol (h. a. = 0°) - taille non 
ponctuelle ; 

- distance en kilomètres - h, a. de 0° à 45° y 

- très grande distance - h. a. de 45° à 60° - taille ponctuelle 


(b) Sur la deuxième planche ont été rajoutées les modalités les 

plus significatives (i.e. les plus éloignées de l'origine) des 
variables supplémentaires tandis que la structure de la repré- 
sentation (variables actives et axes) reste inchangée. 

Ceci conduit à trois groupes de modalités qui s'étirent dans 
trois directions principales de dispersion : 

- vitesse très rapide, rouge, vert, juin, inférieure à 1 mn, 
pas d'information sur la taille, la vitesse ou la distance, 
associées aux confusions avec des bolides et autres rentrées 
atmosphériques ; 

- lent, immobile, plus de 20 mn, très grande distance, taille 
ponctuelle, associées aux confusions avec Vénus ou une 
étoile ; 

- vu au sol, distance en mètres, non lumineux, gris, métallisé, 
lieu désert, taille non ponctuelle, associées à l'ensemble 
éclectique des phénomènes les plus rarement cités (montgol- 
fière, phare, canular, traînée d'avion.,.). 

Et enfin, on remarque un "marais statistique" c'est-à-dire 
l'ensemble du reste des modalités stagnant autour de l'origine 
sans caractér ist ique déterminante. Il apparaît donc que des 
confusions avec certains corps (lune, fusée, avion, nuage) peu- 
vent donner lieu à des descriptions tellement variées qu'il 
devient impossible de retrouver, à l'état actuel du codage, la 
typologie antérieure aux observations. 
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(ç) Conclusion : 

Ainsi, seules trois classes apparaissent nettement dans la 
typologie : 

“ les confusions avec des rentrées atmosphériques ; 

“ les confusions avec des étoiles ou des planètes j 

— un rassemblement hétéroclite de confusions avec des 
artéfacts. 

L'information qui subsiste après témoignage et codage est insuf- 
fisante pour espérer distinguer de façon significative d’autres 
classes. 
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4. - COMPARAISON IDENTIFIE / MON- IDENTIFIE 


Il est clair que cette distinction identifié / non-identif ié 
concerne le système : phénomène - conditions d'observation - 
témoin - expert dans toute sa complexité ; aussi, les conclusions 
se limiteront à deux points particuliers ï 

• Caractériser les cas non-identif iés (D) par rapport aux cas 
identifiés a posteriori, c’est-à-dire plus simplement déterminer 
les spécificités les plus générales de ces cas qui ont, en défi- 
nitive, conduit l'expert à ne pas les rattacher à des phénomènes 
connus . 

• Etudier, par des méthodes d'analyses factorielles, la ré- 
partition des cas D dans la typologie sommaire et les structures 
élaborées au paragraphe précédent pour les cas identifiés a 
posteriori (A ou B). Est-ce que ces cas D se rapprochent de 
certaines identifications, est-ce qu'une ou plusieurs sous- 
classes homogènes vont se démarquer ? 


4.1. - DESCRIPTION SOMMAIRE 


On se propose donc de comparer les distributions des observations 
sur les différentes variables en fonction du type (A ou B, 

C et D) . Ceci conduit à la représentation par les histogrammes de 
l'Annexe 2. Comme c'est essentiellement pour l'usage des analyses 
factorielles que le codage du paragraphe 2.2. a été élaboré, on 
conserve dans ce cas particulier le codage brut (Cf. Annexe 1) 
des variables qui est plus précis sans que cela ne nuise à la 
robustesse de l'analyse. 


L'étude des histogrammes, de l'Annexe 2 amène les remarques sui- 
vantes : 

• Pour la plupart des variables les distributions sont 
relativement homogènes d'un type à l'autre et ce sont les cas D 
qui sont le plus documentés (i.e. où les Informations non dispo- 
nibles sont les moins nombreuses) . 

• Des différences significatives apparaissent pour les dis- 
tributions de certaines variables : 

- comparativement moins d'observations de cas D dans les 
"hameaux, petits villages" et plus dans les zones dé- 
peuplées (habitation isolée, désert, haute montagne et 
utilisation moindre d'instruments (jumelles, photos...) ; 

- moins d'observations de cas D de durées brèves (< 1 mn) sou- 
vent interprétées par la suite comme des rentrées atmosphé- 
riques et plus d'observations de durée moyenne ; 
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- la distance est beaucoup plus souvent estimée pour les 

cas D avec une prépondérance pour l'intervalle 20 m - 1 km ; 

~ absence de bruit plus marquée pour les cas D ; 

“ très nettement plus de hauteurs angulaires estimées nul les 
<vu au sol ou "près du sol") pour ces mêmes cas D ? 

- nettement plus d'estimations métriques de la taille entre 
2 et lO m. 

Ainsi une observation reste non- identifiée surtout si le phénomène 
a été perçu par le témoin dane un oadre très " humain " ; i.e. juqé 
à une distance Inférieure au km d'une taille "raisonnable" de 2 à 10m, 
souvent proche de l'horizon et pendant une durée moyenne, suffisante 
pour une observation détaillée mais insuffisante pour la recherche 
d indices matériels (photos avec réseau de diffraction, mesures 
physiques . ..). 


; 

4 . 2 . - REPRÉSENTATIONS FACTORIELLES 


On reprend donc les mêmes méthodes que celles utilisées au para- 
graphe 3.3.. La population est cette fois l'ensemble des cas A, 

B et D } les cas C ont été volontairement éliminés afin de limiter 
la confusion déji importante entre les divers types de cas. Ce sont 
toujours les mêmes variables (durée, taille, distance, luminosité, 
vitesse, hauteur angulaire) codées comme au paragraphe 3*3. qui 
sont considérées comme variables actives. 

(a) A une rotation près, on retrouve dans la troisième planche 
la même représentation que dans la planche 1 . Celle-ci amène 
donc les mêmes commentaires en remarquant que, cette fois, 
c'est le premier axe qui prend en compte les liaisons entre 
las variables ; estimation de la distance, de la hauteur 
angulaire, de la taille tandis que le deuxième axe est lié 
à^la durée de l'observation. La présence des cas D dans 
l'analyse ne modifie donc en rien les "structures" des variables 
qui peuvent être Interprétées en un certain sens (1) cômroe 
les caractéristiques des descriptions de phénomènes non- 
identifiés pour le témoin et que ceux-ci soient identifiés 
ou non a postérlori. La présence des cas D ne fait qu'accroître 
(axe de plus grande inertie) la distinction entre, d'une part, 
les phénomènes jugés dans le cadre de référence du témoin 
(vu au sol, distance en mètres, taille non ponctuelle) et 
d'autre part la classe de confusions avec des phénomènes 
astronomiques . 

U I Ces ^caractéristiques** sont à approfondi re sur le plan expé— 
rimental de la psychologie de la perception à l'aide d'outils 
statistiques décisionnels et non plus seulement descriptifs. 
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(b) Le calcul analogue & celui effectué pour la plance 2 et 
concernant les autres modalités n'appelle pas de remar- 
ques complémentaires. 


*1*3. - REPRÉSENTATIONS DES OBSERVATIONS (PLANCHE *1) 


On cherche maintenant à situer les cas D par rapport aux classes 
des cas identifiés. Pour ceci, il suffit de reprendre le plan 
factoriel des planches 1 et 2 et d 1 y projeter les observations 
au lieu des modalités des variables. Les cas identifiés qui par- 
ticipent h l'analyse (i.e. au calcul des axes d'inertie du nuacre) 
sont^codés de 2 à M tandis que les cas non-identif iés, codés par 
des “1" sont considérés de poids nul et ainsi n'interviennent pas 
dans le représentation. Ceci permet donc de comparer les cas 
non identifiés non pas à la réalité des phénomènes connus mais 
bien à la réalité de témoignages de ces phénomènes avec toutes 
les déformations dont il faut bien tenir compte pour rendre les 
comparaisons possibles. 

Parmi les cas identifiés, on retrouve bien les trois axes de 
dispersions conformément à ceux notés précédemment et sur lesquels 
est projetée la diaspora des cas non-identif iés. On remarque 
que les sources de confusions possibles donnent des représentations 
très enchevêtrées, pas du tout disjointes les unes des autres, 
montrant ainsi que, témoignage, expertise et codage entraînent 
de très grosses pertes d'informations (i.e. un accroissement 
de l'entropie) > de la vingtaine de classes de la typologie 
initiale {avant témoignage), il n*en subsiste que trois et peu 
distinctes les unes des autres. 

La projection des cas non-identif iés n'amène en apparence pas 
de classe nouvelle. Ils se répartissent selon les trois classes 
ou axes de dispersion déjà existants mais avec une préférence 
très marquée pour le quart en haut à gauche.. Ceci laisserait 
donc penser, qu'à l'exception des. cas non-identifiés qui sont 
(ou se comportent comme) des confusions astronomiques, les 
autres sont à rattacher à l'ensemble * des "confusions hétéro- 
clites 11 . Ceci ne signifiant pas que tous les cas D sont des 
confusions de même type mais plutôt qu'ils seraient à rattacher 
à un rassemblement de cas particuliers en marge des confusions 
les plus fréquentes. Mais il faut relativiser cette dernière 
remarque en rappelant que la population étudiée n'est pas celle 
des phénomènes mais celles de comportements de témoins variés 
dans des conditions diverses. De plus, l'une des variables pré- 
pondérantes pour caractériser la troisième classe est l'estima- 
tion de la distance (distance en mètres) et comme le note 
JIMENEZ - 82 lors de l'étude de cas à témoignages multiples 
(rentrée de satellites avec plus de 40 observations par exemple) 
ces estimations sont toujours fausses par rapport à la réalité 
du phénomène : il s'agit toujours de sous estimation traduisant 
un rapprochement subjectif très prononcé du phénomène". 


* Il s'agit là d'un ensemble et non pas d'une classe bien définie. 
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5. - CONCLUSION 


^complexité de l'objet de l'étude alliée au manque de fiabi- 
lité des informations rendent les études statistiques très dé- 
licates. La classification obtenue au paragraphe 3 faisant 
apparaître principalement 3 groupes : 

- confusion avec des rentrées atmosphériques 

- confusion avec des étoiles ou planètes 

- confusion avec des artéfacts très divers 

reflète bien les diffucultés rencontrées. De la typologie ini- 
iale des phénomènes supposés à l'origine des observations , il 
ne subsiste que quelques classes mal distinctes concernant le 
comportement du système "phénomène/témoin/situation/expert" 
et non plus seulement les phénomènes. 


En ajoutant les cas non-identifiés (§ 4) f ces difficultés ne 
font que s'accroître car la variable "estimation de la distan- 


ce". 


' V _ _ , UC ld U X titan- 

paramètre le plus subjectif, prend une place prépondérante, 

En 1 .fï at J actue ï ^ es c *' oses » c'est-à-dire tant qu'il reste im- 
possible de produire une typologie fiable, le plus prudent, à 
1 exception des cas relevant de confusions banales (planète, 
rentrée atmosphérique) est de considérer chaque cas comme un 
cas particulier à traiter individuellement. 
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6. - PERSPECTIVES 


6 . 1 . - PROBLÈMES 


Les problèmes rencontrés lors de cette étude sont de deux 
ordres : 

• Manque d'informations ; 

• Subjectivité ou déformation de celles-ci. 


La réponse au premier nécessiterait d'une part une action auprès 
de la Gendarmerie Nationale en vue de donner aux procès- 
verbaux une forme plus adaptée, et peut-être même une action 
auprès du public (i.e. auprès des témoins potentiels) et, 
d'autre part, un codage exhaustif de ces procès-verbaux. 

Il ne s'agit donc plus de faire rentrer un procès-verbal dans 
un moule {le codage) mais bien de prendre en compte le maximum 
d'informations en respectant la forme employée par le témoin. 

On est donc conduit à relever, pour chaque procès-verbal, tous 
les mot-clés en clair tels que les a cités le témoin* sans faire 
de regroupement a priori. Ce n'est qu'a posteriori et selon les 
besoins d'une analyse qu'il sera possible d'établir des tableaux 
de synonimes afin de permettre la comparaison des procès-verbaux. 
Cette démarche nécessite des outils Informatiques plus sophis- 
tiqués que ceux utilisés jusqu'alors et donc évidemment plus 
coûteux . 

Une réponse théorique est proposée ci-dessous pour aborder 
le deuxième problème. 


*('ette gestion des procès-verbaux est en cours de mise en place. 
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6 . 2 . - MODÈLE THÉORIQUE 


La situation est la suivante t 

Un phénomène, dont les caractéristiques sont représentées par 
une variable aléatoire multidimensionnelle Y (forme, couleur, 
luminosité...), est observé par un témoin qui en fait une 
description à l'aide d'une variable de même type X. Que peut-on 
aire des valeurs prises par Y connaissant X ? 

Concernant un phénomène isolé, il n'y a pas de solution mais 
si on se place au niveau d'un ensemble (une population) d'ob- 
servations, ce qui importe ce ne sont plus les caractéristiques 

i«? n ^ Phén °w è îîf,?fî 8 J leurs fré< 3 «ences d'apparition ou encore la 
loi de probabilité de Y (par exemple î nombre de phénomènes 
rouges ou probabilité qu'un phénomène soit rouge). 

P!?!‘w e J Ca8 ' , COIin * lésant (ou sachant estimer) la loi de proba- 
bilité de X (par exemple : probabilité pour que le témoignage 
relate un phénomène rouge) et la loi conditionnelle de Y à X 
(par exemple t probabilité que Y soit rouge sachant que X le 
décrit vert ou bleu ou rouge... ]| alors la loi de Y peut être 
estimée. 

Ainsi dans ce cadre théorique idéal, les analyses factorielles 
calculées comme aux paragraphes 3 et 4 et les classifications 
ne concerneront plus les témoignages mais décriront bien la 
population des phénomènes étudiés (pour plus de détails, cf 
BESSE-VIDAL - 82 ou encore l'annexe 3 ). 

En pratique, l'estimation de la loi conditionnelle de Y à X 
pose de gros problèmes et nécessite de nombreuses expériences 
avant d être opérationnelle surtout lorsque, comme c'est le cas 
pour les variables hauteur angulaire, distance, taille, les 
erreurs d estimations ne sont pas indépendantes. (Cf. Annexe 3 ). 
a s, au minimum, cette démarche permet de pondérer les variâ- 
tes en fonction de leur fiabilité. Dans le cas de la distance, 
£ a f e îf ln ?^ e ï probabilité qu'un phénomène soit en réalité 
très éloigné (distance astronomique) alors qu'il a été estimé 
proche (quelques centaines de mètres) est loin d'être négligea- 
ble (cf. les cas de rentrée de satellite in JIMENEZ - 82) . La 
dispersion artificielle introduite par cette variable sera 
alors très sensiblement atténuée comparativement aux variables 
qui, à 1 expérience, se montreront plus fiables. 



28 


6.3. - STRATÉGIE 


L'approche proposée nécessité alors trois étapes : 

• estimation de la loi conditionnelle par des expériences 
en laboratoire et à l’aide des cas d'observations multiples 
où, d'une part, les caractéristiques réelles du phénomène sont 
connues, et, d'autre part, de nombreux témoignages permettent 
de faire des estimations ; 

• test ou qualification de ces estimations en les appli- 
quant à l'étude des cas identifiés a posteriori. Si les 
résultats obtenus sont insuffisants (mauvaise classification 
par exemple), il faut affiner l'étape précédente sinon ï 

• application à l'étude des cas non-identif iés . 


6.4. - CONCLUSION 


Il est clair que les outils statistiques classiques ne sont 
guère adaptés à l'étude de phénomènes rares et non reproduc- 
tibles pour laquelle ils n'ont pas été conçus. 

I.' approche proposée dans ce paragraphe devrait permettre de 
remédier à certains des problèmes rencontrés mais celle-ci 
sera évidemment longue et coûteuse ; c’est le prix à payer si 
l’on veut espérer limiter l’accroissement de l'entropie observé 
tout au long du cheminement de l'information. 
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ANNEXE 1 


RÈGLES DE CODAGE (VERSION 4) 


<cf. N. T. n° 1) 
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2.9. DATE - 8 cases 


Date non disponible : 

St ta data est disponible, les deux premières cases contiennent le quantième 

i °“ r ' î** f eUX .“^ V * nte8 le nuBléro du »»i* et les quatre dernières, l'année 
<ex. 1er février 1978 - 01021978). Si la date est partiellement connue, on 
codera les parties connues et on mettra des * pour les parties inconnues. 


2.10. HEtIKB - 5 cases 


Utilisation des 5 caractères de la façon suivante t 

a) 4 premiers i Heure locale suivant le format t hham 

Si cette heure est inconnue t 

b) 5èma t estimation grossière de l'heure suivant le «Hq : 

M ■ matin 
V « vers midi 
P ■ après midi 
S ■ soirée 
C * crépuscule 
O ” début de la nuit 
Z ■ vers minuit 
F - fin de la nuit 
L “ aurore 

Exemple t 20 heures 40 minutes ■ 2040D 

Donc, en général, l'heure sera codée selon les d»»K 


2.11. DEPARTEMENT - 2 cases 


On mettra le numéro du département dans lequel se trouve le lieu de 
1 observation. Exemple * Haute-garonne - 31. Si l'information n'est pas dispo- 
nlble, on mettra U r 

„„ * S1 l * ob8ervation * été *«lte hors de la métropole, dans les terrltoi- 

p^int TT 0n Bettr “ deUX Zér ° 3 (00) • pour l'étranger, on mettra deux 


2.12. LONGITUDE - 4 cases 


(au dixième T * on f ltude œe3Urée en degrés et fractions décimales 

(au d^^de^degrô p rès , , à partir de Greenwich , positivement vers l'Est. 

+ 2 degrés et 15 mn » +022 

- 2 degrés et 25 centièmes de degré ■ -022 ou 3578 

tre * ÜL* PaS f‘ inforBlatlo n de longitude disponible, on mettra qua- 

entre -Tît’JTî * T B f tro P° lltaine ' le * longitudes sont comprises 

et + 9 degrés* La longitude de Paris est de 2,33 degrés. 


* * * / * * * 
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2.13. LATITUDE - 4 cases 


Il s'agit de la latitude mesurée en degrés et centièmes de degré 
(au dixième de degré près) positivement vers le Nord. Exemple : 49 degrés 
et 20 minutes = + 493. S’il n'y a pas d'information de latitude, on mettra 


2.14. NATURE DU LIEU - 1 case 


Témoins potentiels 

* 

O D 

O à lO S 

lO à ÎOO H 

ÎOO à lOOO B 

lOOO à lO OOO V 

ÎOOOO A 


Inconnue 

désert, haute montagne, mer 
habitation Isolée 
hameau, petit village 
bourgade, banlieue 
ville 

vue d f avion 

connue mais n'entre pas dans les rubriques 
précédentes 


2.15. NOMBRE DE TEMOINS - 1 case 


Code 


Nbre 



* I 1 

2 31 4 $ 6 

7 

a 

9 

témoins 

inconnu î 1 

2 3 f 4 i 5 dizaine 

centaine 

millier 

+ millier 


2.16* PROFESSION DU TEMOIN PRINCIPAL - 2 cases 


Voir annexe 2 - SI la profession est Inconnue, on mettra : ** 


2.17. AGE DU TEMOIN PRINCIPAL - 3 cases 


L âge du témoin étant en général connu, il semble intéressant de le 
coder sur 3 caractères afin de limiter l'effet de l'arbitraire de la classifi- 
cation. 

2 premiers caractères : âge en clair 

3ème caractère : classe (suivant le code actuel suivant) : 

* : âge Inconnu 

E : enfant de O à 13 ans 

J : adolescent de 14 à 20 ans 

A : adulte de 21 à 59 ans 

C : vieillard de 60 ans et plus. 


2.18. SEXE DU TEMOIN - 1 case 


On utilisera Les numéros correspondants suivants t 

1 : masculin 

2 : féminin 


* * ♦ / * * 
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2.19. CONDITIONS METEOROLOGIQUES - 1 cas* 

* i pas 4* indication 

1 t très beau temps, ciel pur 

2 t nuages épars 

3 * ciel couvert mais à haute altitude 

4 t ciel bas, mauvais temps sans pluie 

5 i pluie, grêle, neige, orage, faible visibilité 

6 i 1 avec vent 

7 t 2 avec vent 

B t 3 avec vent 

9(4 avec vent 

A i 5 avec vent 

* t autres conditions 


2.20. DORES DE L* OBSERVATION - 5 cases 

. . Ce ?? ltèr * “ ar * codé en clair et de la façon suivante , 

les 4 premières cases pour la durée en chiffre 

la Sème case pour la classe (S i secondes, M : minutes, H : heures) 


Toutes les cases sont remplies t 
R i pas d * indication de durée 
S i de O A 59 secondes 

M t de 1 â 1440 minutes (soit de 1 mn à 24 h) 

H t supérieure A 24 heures 
. t autres cas 

Exemple t 15 secondes............. OOISS 

2 heures 45 minutes Ot65M 


2.21. DISTANCE MINIMALE D'OBSERVATION - 4 cases 


. , Ce " ltère * era codô •» clair et de la façon suivante 

les 3 premières cases pour la distance chiffrée 

- La 4ème pour la classe (H-mètres, K-kilomètres, A>3 km). 


R J pas d'indication 
M . t de *0 A 999 mètres 
K t de 1 A 3 kilomètres 
A t supérieure A 3 kilomètres 


Exemple t 55 mètres OS5M 

>' s J"» 1.5K 


2.22. METHODE D'OBSERVATION - 1 case 


* t pas d* Indication 
A : oeil nu au sol 

B ï jumelles, longue vue, théodolite 
C ; lunette astronomique 
D : télescope 
E i photographie ou film 
F i radar 

G : jumelles + photo 

H : visuel + radar 

J t oeil nu à partir d*un avion 


< * » / * 



K : oeil nu à partir d f un bateau 
L : jumelles à partir d'un bateau 
M : télescope +■ photo 

N : à bord d'un véhicule automobile en marche 
P : à bord d'un véhicule automobile â l'arrêt 
. : autres méthodes 


2.23. NOMBRE D'OBJETS - 2 cases 


: pas d'indication 
OO : aucun objet 

de Oi à 98 : nombre d'objets si inférieur à 99 
99 ; si 99 objets ou plus 

NOTA : au-delà de ÎO objets, on arrondit au nombre de dizaines si 
le nombre n'est spécifié explicitement nulle part. 


2.24. FORME DE L'OBJET PRINCIPAL - 1 case 


* : pas d'indication 

A : disque, soucoupe lenticulaire 

B : ronde, circulaire, boule 

C : cigare, cylindre, fusée 

D : oeuf, ovale, ovoïde, ballon de rugby 

E : conique, triangulaire, chapeau asiatique, trapézoïdale 
F : toupie 

G : carrée, rectangulaire, parallélépipédique 
H : soucoupe à coupole, chapeau de canotier 
J : couronne, pneumatique 
K : ponctuelle, étoile, grosse pLanète 
L : dôme, tasse, parachute, parapluie, meule de foin 
M : méduse, champignon 
N : croix 
P : croissant 

Q : cigare accompagné de disques 
R : nuée, nuage, halo 
S : nid d'abeilles 
. : autres formes 


2.25. TAILLE - 2 cases 


1er cas : évaluation non métrique 


Pour la 1ère case 


Pour la 2ême case 


C - par comparaison 
A - angulaire 

* - pas d'indication 

. - autres types non métriques 

A - immense, très gros 
B - comme une pièce de 5F 
C - comme une orange 
D - comme une assiette, un melon 
E - comme une citrouille 
F - comme un avion 
G * comme la lune 
H - comme une voiture 
J - comme une grosse étoile 

K - petit - tout petit 

* - autres comparaisons 


Par comparai son 
ex. comme la lune 
CG 
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O A 9 dizaines de minutes d'arc 1 

• non codable (sud. A 1*30') I Angulaire 

J ex. A6 (f) 

2Ane cas : évaluation né trique 

On utilise les 2 cases pour coder la plus grande distension évaluée 
Ol à 98 * taille en mètres 
99 i 99mètres ou plus 

OO t infénleur à 1 mètre 

3ème cas t pas d* Indication f on utilisera t es 

fiOSEA * Dans le cas oû plusieurs types d'indications sont fournis, on gardera 
l'indication la plus crédible, cette appréciation étant laissée au co- 
deur. De toutes façons, les deux cases doivent être remplies. 


2.26. LUMINOSITE - 2 cases 


Combinaison de 2 paramétres si nécessaire x 

- 1ère case t paramétre paraissant le plus Important, 

- 2ème case » paramétre apportant un enrichissement. 

Si un seul paramétre, laisser la 2«me case vierge. 
* x pas d'indication 

1 t lueur, faiblement lumineux 

2 > lumineux, fluorescent 

3 t brillant, très lumineux 

é.i Intense, éblouissant, éclatant 

5 t non lumineux 

6 x réfléchit la lumière du soleil ou autre lumière 

7 t halo seulement 

8 i variable en intensité ( de O A OO mais non périodique) 

9 x clignotant 

A i non lumineux mais avec faisceaux 

. t autres types 


2.27. COULEUR - I case 

* i pas d'indication 
A i rouge sombre 

B x rouge 
C i orangé, feu 
D t jaune, ambre 
B x vert 
F : bleu 

G t bleu sombre, métallique, indigo 
Et x violet 
J x blanc 
K x noir 
L : gris 

H î métallique (argent, aluminium poli) 
N x plusieurs couleurs 
F t couleur (s) changeante (s) 

Q t marron 
R : or 

• t autres couleurs 


*»•/*., 
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2.28. TRAJECTOIRE - 2 cases 


Combinaison de 2 paramètres si nécessaire. Si un seul paramètre, 
laisser la 2ème case vierge. 

± : pas d’indication 

A : ligne droite, ou courbe très ample - immobile ou ligne droite avec arrêts 
B : virages brusques 
C : arabesques compliquées 

D : trajectoire complexe mais analysable (périodicité, suivi de route, de 

fleuve, etc ) 

E : stationnement près du sol 

F : atterrissage et arrêt prolongé avant décollage y 
G : atterrissage puis décollage immédiat ^ 

H : objet vu au sol qui décolle ^ 

J : objet pénétrant ou sortant de l’eau 

K : objet qui monte et se perd dans les étoiles 

L î nulle puis lente 

M : nulle puis rapide 

* ; autres types de trajectoire 


2.29. VITESSE - 4 cases 


Ce critère sera codé en clair de la façon suivante : 

- les 3 premières case3pour la vitesse chiffrée (en centaines Km/h) 

- la 4ème case, pour la classe. 

* pas d’indication 
A lente ou très lente ou immobile 
B très rapide 
C variable 
D fulgurante 
E vitesse d’un avion 
. autres types de vitesse 

Si l'information est variable, on code la plus grande suivie de la 


lettre C. Exemple : très rapide IOOO km/h OlOB 

immobile OOOA 

variable sans précision *»C 


2.30. ACCELERATION - 1 case 


* : pas d'indication 

1 : faible 

2 : variable 

3 : élevée 

. : autres types 


2.31. BRUIT - 1 case 


± : pas d’indication 

A : aucun bruit, silence total, objet silencieux 
B : bourdonnement, vrornbrissement , bruit d’abeilles, grondement 
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C t alffl«unt aigu 
D i bruit d'air ccnprlai s'échappant 

B i bruit de moteur électrique démarrant ou de machine centrifuge 
F i explosions violentes 
G t bruit de vent violent sous l'objet 
H t aucun bruit perceptible 
. i autres bruits 


2.32. HAUTEUR ANGULAIRE - 2 cases 


On notera la hauteur en début et en fin d'observation t 
-1ère case t début 
' -2ème case t fin 

51 un seul paramètre, laisser la 2£me case vierge. 

R * pas d'indication 

1 * de O à 15* (ou bas sur l'horizon) 

2 x de 15 A 30* 

3 t de 30 A 45* 

4 * de 45 â 60* 

5 i de 50 a 90* (proche du zénith) 

6 i au-dessous de l'horizon, sous un avion 

7 i observé d'un avion, a la même hauteur ou au-dessus 

8 i objet vu au sol ou près du sol 
. i autres types 


2.33. DIRECTIONS AZIMUT ALES - 2 cases 


Les directions azimutales seront estimées dans les secteurs angulaires 
suivants î (azimut en degrés a partir du Nord, positivement vers l'Est) : 


R * pas d'indication 
1 * -22,5 a + 22,5 vers le nord 

nord-est 


2 

; 

22,5 A 

67,5 

3 

s 

67,5 A 

112,5 

4 

: 

112,5 A 

157,5 

5 

i 

157,5 A 

202,5 

6 

s 

202,5 A 

247,5 

7 

t 

247,5 A 

292,5 

8 

t 

292,5 A 

337,5 

0 

t 

A la verticale 

. 

ï 

pas codable 


est 

sud-est 

sud 

sud-ouest 

ouest 

nord-ouest 
(vers le zénith) 


Û» donne ainsi la direction 
en fin d'observation. 



azimutale au- début de l'observation puis 


3 . CONCLUSION 


£n régie générale, quand l'information n'est pas disponible, on 
code R et quand l'information est disponible, mais non compatible, avec les ré- 
gies de codage prévues, on code . (point) . Par conséquent, il ne peut pas en 
principe, y avoir de blancs dans les 79 cases exceptées les cases 66, 69 et 77. 

Il s'agit donc, en général, d'une grille de signification. Les 
indications contenues dans les témoignages peuvent n'être identiques à aucun des 
cas proposés, mais se rapprocher fortement de certains. Ceci reste à l'apprécia- 
tlon du codeur* 
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ANNEXE 2 


RÉPARTITION DES OBSERVATIONS SELON LE TYPE 


CAS A OU B 
CAS D 
CAS C 
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REGION D'OBSERVATION 


1. DOM- TOM 

2. sud-ouest 

3. sud-est 

4. centre 

5. ouest 

6. nord 

7. est 





1. Information non disponible 

2. désert* haute montagne* mer 

3. habitation Isolée 

4. hameau, petit village 

5. bourgade* banlieue 

6. ville 

7. grande ville* métropole 

8. vue d'avion 

9. Information non codable 



I 

Z 

3 

4 

5 

6 

7 

8 


un témoin 
deux témoins 
trois témoins 
quatre témoins 
cinq témoins 
dizaine 
centaine 
millier 





ti 5 




agricole 

de l'industrie et du commerce 
libérale et cadre supérieur 


30 


20 T 


10 H 


1 2 3 



ouvrier 

personnel de service 
autres (police, années) 
non actif 

information non disponible 



#16 


AGE OU TEMOIN 


1. Information non disponible 

2. enfant de 0 à 13 ans 

3. adolescent de 14 i 20 ans 

4. adulte de 21 Â 59 ans 

5. 60 ans et plus 






H8 




1. information non disponible 

2. très beau temps, ciel pur 

3. nuages épars 

4. ciel couvert mais i haute altitude 

5. ciel bas, mauvais temps, sans pluie 

6. pluie, grêle, neige, orage, faible 
visibilité 


3 — 




7. très beau temps, ciel pur, avec vent 

8. nuages épars, avec vent 

9. ciel couvert à haute altitude avec vent 

10. ciel bas, mauvais temps, sans pluie, 
avec vent 

11. pluie, grêle, neige, orage, faible visl 
bilité et vent 

12. information non codable 


3 4 


b 6 


7 G 9 10 11 


12 



t 


DUREE DE L'OBSERVATION 


DÇ 




1. <£10 s 

2. J^IO s et < 59 s 

3. 3:1 mn et <3 mn 

4. ^3 mn et <10 mn 

5. ^10 mn et < 20 mn 

6. ^20 mn et < 1 h 

7. ^1 h 

8. non disponible 



I 


2 3 4 5 6 


7 8 



2. >10 m et < 20 m 

3 . ^20 n et < 150 n 

4 . ^ 150 net <. 1 km 

5. ^ 1 km et <3 km 

6. j> 3 km 

7. non disponible 
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% 

60 


40 



1. Information non disponible 

2 . oeil nu au sol 

3. jumelles, longue vue, théodolite 

4. lunette astronomique 

5. photographie ou film 

6. jumelles + photo 




£ 


4 5 


6 


7 C 


7. visuel + radar 

8. oeil nu â partir d'un avion 
9- oeil nu à partir d'un bateau 

10. â bord d'un véhicule automobile en marche 

11. â bord d|un véhicule automobile à l'arrêt 

12. information non codable 


9 10 11 12 


2 3 


P\> 
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1 2 3 4 5 6 


7 8 9 10 11 12 13 


FORME PRINCIPALE 


1 - Information non disponible 

2 - disque, soucoupe lenticulaire 

3 - ronde, circulaire, boule 

4 - cigare, cylindre, fusée 

5 - oeuf, ovale, ovoide, ballon de rugby 

6 - conique, triangulaire , chapeau 

asiatique 

7 - toupie 

8 - carrée, rectang., parallélépipédique 

9 - soucoupe à coupole, chapeau de cano- 

tier 


10 - couronne, pneumatique 

11 - ponctuelle, étoile, grosse planète 

12 - dôme, tasse, parachute, parapluie, 

meule de foin 

13 - méduse, champignon 

14 - croix 

15 - croissant 

16 - cigare accompagné de disques 

17 - nuée, nuage, halo 

18 - information non codable 



4" 15 16 I? le 






LUMINOSITE PRINCIPALE 



1 - Information non disponible 

2 - lueur, faiblement lumineux 

3 - lumineux, fluorescent 

4 - brillant, très lumineux 

5 - intense, éblouissant, éclatant 

6 - non lumineux 



7 - réfléchit la lumière du soleil 

8 - halo seulement 

9 - variable en intensité 
LO - clignotant 

11 - information non codable 

12 - non lumineux, mais avec faisceaux 
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LUMINOSITE 



2. Lueur, faiblement lumineux 

3. lumineux, fluorescent 



% 

60 


40 


20 



8. variable en Intensité 

9. clignotant 

10. non lumineux, mais avec 
faisceaux 

11. Information non codable 

12. pas d'information secondaire 


I 2 3 4 5 6 7 6 9 10 11 12 
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COULEUR 


% 

3Q| 


204 


10J 


1. information non disponible 

2. rouge sombre 

3. rouge . 

4. orange, feu 

5. jaune, ambre 

6. vert 

7. bleu 

8. bleu sombre, métallique, indiqo 

9. blanc 


EL 


M 

30] 


20 



10. noir 

11. gris 

12. métallique (argent, aluminium 

13. plusieurs couleurs 

14. couleur(s) changeante(s) 

15. marron 

16. or 

17. information non codable 

18. violet 



poli) 
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b CH 


4Q 

20 - 


CARACTERE PRINCIPAL DE LA TRAJECTOIRE 



v 

ôQ 

40-1 


1. information non disponible 

2. ligne droite ou courbe très ample. Immobile 

3. virages brusques 

4. arabesques compliquées 

5. trajectoire complexe mais analysable 

6. stationnement près du sol 

7. atterrissage et arrêt prolongé avant décollage 


20 . 




« 

60 ' 

40 _ 

20 . 

— ! 

12 3 4 


8. atterrissage puis décollage Immédiat 

9. objet vu au sol qui décolle 

10. objet pénétrant ou sortant de l'eau 

11. jobjet qui monte et se perd dans les étoiles 

12. vnul1e puis lente 

13. ^nulle puis rapide 

14. information non codable 



5 6 7 8 S 10 U 12 13 14 




1 


60 


40 



1. pas de caractère secondaire 

2. information non disponible 

3. ligne droite ou courbe très ample/imntobi le 

4. virages brusques 

5. arabesques compliquées 

6- Trajectoire complexe mais analysable 

7. stationnement près du sol 


20 J 




J. 

* 

60 ■ 


40 

20 


8. objet vu au sol qui décolle 

9. objet pénétrant ou sortant de l’eau 

10. l’objet monte et se perd dans les étoiles 

11 . nul le puis lente 

12. nulle puis rapide 

13. information non codable 


Ir 


2 J <| 


S 


6 7 


8 9 10 11 12 


13 


1. information non disponible 

2. lente ou très lente ou Immobile 

3. très rapide 

4. variable 

5. fulgurante 

6. vitesse d'un avion 

7. Information non codable 





APPRECIATION OE L’ACCELERATION 


1. information non disponible 

2. faible 

3. variable 

4. très élevée 

5. information non codable 




T 


1. information non disponible 

2. aucun bruit, silence total, objet silen- 
cieux 

3. bourdonnement, vrombissement, bruit 
d'abeille 

4. sifflement aigu 


tu 



bruit d'air comprimé s'échappant 
bruit de moteur électrique 
démarrant 

explosions violentes 
aucun bruit perceptible 
information non codable 



$ 


2 3 


b 6 


7 






de 60 â 90 degrés 
au-dessous de l'horizon, 
sous un avion 

observé d'un avion (même altitude ou 
au-dessus) 

objet vu au sol ou près du sol 
Information non codable 



AZIMUT EN DEBUT D'OBSERVATION 


6M 





I 


2 3 


4 5 5 7 


ci 5 


10 11 
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ANNEXE 3 


APPROCHE THÉORIQUE 


Ph. BFSSE Cl. VIDAL 
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| - INTRODUCTION 

Il est fréquent , en pratique, d'avoir à étudier un phénomène décrit par une 
variable aléatoire (v.a.) Y inobservable (ou bien trop coûteuse à observer). Pour 
pallier â cet inconvénient l'étude de ce phénomène se fait au travers d'une v.a. X 
qui est -elle- observable et dont on peut estimer la liaison avec Y (en laboratoire 
ou sur un echanti lion- test) . Dans le cas oïl Y est une variable qualitative multi- 
dimensionnelle, une étude descriptive peut conduire à l'utilisation de l'Analyse 
Factorielle des Correspondances (A.F.C.) si Y est de la forme (Yj^Yj) 1 À.F.C. 
généralisée lorsque Y est un ra-uple (Y| t Ï 2 > • • • *1^) * Pour déterminer cette analyse, 
il suffit de connaître (ou tout du moins d'estimer) la loi de Y. Celle-ci est dé 
terminée (peut être estimée) dès que l'on connaît (sait estimer) la loi de X et 
la loi conditionnelle de Y à X. 

Cette approche peut être utilisée en particulier dans le problème concret 
(à l’origine de cet article) exposé par P. BESSE [Il et que l'on peut résumer ain- 
si : des témoins observent un ensemble de phénomènes représentés par une variable 
qualitative multidimensionnelle Y dont ils font une estimation X (narration des té- 
moins). Le problème est alors le suivant : comment rendre compte de Y à partir de 
1 1 étude faite sur X ? 

En utilisant les outils introduits par J,F. MARTIN ü S3 sous l'appellation de 
codage ''flou 1 ' (ou codage par une probabilité de transition), ce travail s'inscrit 
dans un cadre plus large visant à intégrer aux analyses factorielles les erreurs 
de mesure, de classement, les problèmes d'arrondi ou de lissage ... qui peuvent 
apparaître lors de l'observation des variables. 

Ainsi, après avoir été sommairement rappelée, la notion de codage est étendue 
à des espaces produits de façon â pouvoir être appliquée à des couples (ou des ro- 
upies) de variables. Ceci conduit alors à des problèmes d'indépendance (indépendan- 
ce des erreurs entre elles, indépendance entre l'erreur sur une variable et les 
autres variables ...) qui sont discutés. Enfin, les problèmes d'estimation et donc 
de convergence sont résolus. 

Remarque : Ce travail se rapportant à l'A.F.C, classique, toutes les tribus con- 

sidérées par la suite sont de cardinal fini* 
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2 - T-CODACE OU CODAGE PAR UNE TRANSITION 

En pratique, les analyses factorielles non-linéaires utilisent essentiellement 
des fonctions indicatrices de modalités (pour des variables qualitatives) ou d'in- 
tervalles (pour des variables quantitatives) » pour modéliser les situations A ana- 
lyser ; ceci revenant h employer le codage disjonctif complet, La simplicité d'em- 
ploi et de mise en oeuvre de cet outil (qui permet d'exhiber simplement une base 
orthonormée) est aussi cause de sa rigidité, de son inadaptabilité à certains pro- 
blèmes spécifiques, C'est pourquoi certains auteurs ont introduit d'autres formes 
de codage faisant appel â des fonctions spline (D. LAFAYE de MICHEAUX [6 1 , 

J, O, RAMSAY - S. WINSBERC [III et [121 , J- VAN RUCKEVORSF.L [13 I ) ou bien à la 
notion de codage flou (J, P, BORDET [ 2 ) , J ,F. MARTIN f 8 J ) - notions reprises très 
récemment par J.L. MALLET [73 et J.M. GAUTIER , G* SAPORTA [5 J -, On peut encore 
citer D.M. TITTERINCTON [141 qui a développé des outils similaires - estimation 
de densités de probabilités discrètes par la méthode des noyaux - pour l'étude de 
données ca tégoriel les. 

Parmi ces divers modèles, l'approche probabiliste due à J. F. MARTIN f 8 1 (codage 
par une probabilité de transition) a été choisie, car elle semble la plus adaptée, 
et ce pour différentes raisons : 

* elle est synthétique et englobe les autres approches. 

* le cadre précis dans lequel elle est développée permet de donner une signifi- 
cation au codage, et donc d'interpréter les résultats. 

* enfin et surtout, ce n'est que dans ce cadre qu'il est possible de parler 
d'indépendance de codages (des différentes variables à analyser cf. 4.1.). 

2.1 - rappels et notations 

On rappelle ici sommairement Les notions introduites par J. F. MARTIN (81 , au- 
quel on renvoie pour ce qui est des démonstrations. 

Le codage par une (probabilité de) transition permet de tenir compte de cer- 
tains problèmes parasites qui peuvent survenir lors de la saisie des données : 
erreurs de mesure, erreurs de classement, "bruit" qu'il faut lisser, erreurs sys- 
tématiques d arrondi ou encore, coince dans le cas qui nous intéresse, l'analyse 
d'une variable Y à l'aide d'une autre variable X. 

Le principe adopté est alors d'associer à une observation x = X(*u) une proba- 
bilité (i.e. un codage) 



68 


V sur un espace (F,.?) servant. à apprécier l'imprécision de La mesure. S'il n'y 
x 

a pas d'imprécision (ou si l'on ne veut pas en tenir compte), il suffit d'employer 
le codage disjonctif classique. 

wl jtJH û oiïi 

Soient (E t £ ) et (F,!? 7 ) deux espaces probabi 1 isables et P une transition 
sur (E,fc) * ?" , c'cst-a-dire une application. 

(E.fc) — (COJ j,a [on ) 

(x,B) ► P x (B) 

telle que : 

(i) Vx £ E B ► P^(B) eSt Une P ro b a bîlî ta sur (F»?" ) 

(ii) VU ê î x — ► P x (B) est mesura t>le de (E,£) dans ([0,1], ^). 

Si X est une v.a. définie sur (Q,OL) à valeurs dans (E,Ê), alors l'applica- 
tion P^ : 

«i, a) *S — k (io.li, S (0 ) 

<“•“> — -"WW 

définit une transition sur (LJ,6Ü x ^ . 

Vé^aiition ï : 

l)u appelle T -codage ±ua (E,§,| *ela£t|5 à $ (*e£p. T-codage. de X I 

a»e tAanyitlon P *u/t (f, & ) {*eAp. une Vutnï^tLon àuA ^ )» 

PdQ-ûuCton 2 : 

Un T -codage &u\ |E,É ) AelaXitf à ^ définit pou* tout B de ^ une appticatLon 
meittiabfe <j>g débute poji : 

<P B ; (E, é ) * ICMl.Sfyjj 1 

X <t> B f = P^iB) 

e*t appelée, fonction de codage laaociée à B) . 

Exemple* 

* Au codage_dis jouet Lf classique est associée la transition 

P - 6 ; <x,B) ► P^fB) “ 4 X (B) (où 6 X désigne la distribution de 

Dirac au point x) et, dans ce cas, les fonctions de codage sont les indicatrices : 

V*> » ]1 B U). 
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Le codago condi^ti onnel : Soit (X,Y> un couple de v.a. définies sur <S2,a,p) 

â valeurs dans (E x F, t ® 3” ) ; pour tout B de 5 , la fonction ; 

♦ B : < E .&> * (COJj,^ ^) 

x * 4 > b (x) - E^ =X (]J b o Y) 

X= x 

(où Ep (J1 B » Y) est encore la probabilité conditionnelle y [Y * B/ j) est une 
fonction mesurable. 

Si, de plus, il existe une version régulière de la probabilité conditionnelle 
de Y à X, l'application ; 

(E,£ ) ► {[0,1 j , J j) 

(X,B) ► P x (B) = t B (x) - eJ =X (Ü b o Y) 

est une transition sur (E,£ ) x? et on appelle T-codage conditionnel de Y en X 
la transition sur (fi, O) : 

P x : (ü>,B) - p x(tü )< B > = <31 „ ° Y >1 («>• 

?ËE!ÜÏ!1Ï*! * fonction de codage n'est autre que la fonction de régression 

de Jl B « Y en X. 


T -codage d'une p^obabltiti 

Lorsque (E,é) est muni d'une probabilité v, le T-codage définit une probabi- 
lité sur (F,$ ) par : 

£ ► [0,1] 


E v [P.(B)] 


E P x (B) dy(x > 


V V B 


). 


Elle est appalée probabilité codé, de V per P et notée E (P) (ceci correspond 
b la station VP d. J. NEVEU [10], Ua E . a e .oche de 1. probabilité V par P coo- 
sidéré comme un opérateur sous-markovien) . 

Avec les notations des paragraphes précédents, si „ x désigne la loi de X, 
la probabilité codée de y x par P est égale à la probabilité codée de y par P x : 


E (P) 

\i 

1 X 


e m (P x> 


Exemples ; 

* Si P est la transition associée au codage disjonctif, 

Ey (P) " Ey (5) a» U . 

X ■ X x 


on a ; 
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Si P est la transition associée au codage conditionnel» on trouve : 


* VB (E (P) 3 (B) 

X 


E CP (B)] 
*X ' 


P X < B) d^tx) 


P (üj) (B> dp(u>) 

i n x 




2.2 - T-codage sur un espace produit 


VoaLLLoii du ptiübtcmn 

La variable X à laquelle est appliqué le T~codage peut etre un couple (Xj pX^) 

ou meme un ra-uple <X jt *.,,X m ) prenant ses valeurs sur un espace produit (Ej * ... 

E , Ê. ® -** ® Ê )■ Comment peut-on construire le codage de X à partir de celui 
m 1 tn 

des ( i = l , . . - ,m) ? 

Soit donc (E, un espace probabilisé et (F,^) un espace probabilisable 

tels que : 

E = Ej x £ 2 , F a Fj x F 2 et c ^ 2 * | * 2 * 


On note P une transition sur 


(E,fc) . 


ï-codage ma*ge 

Pour tout x de E, P^ est une probabilité sur (F,?) et on peut considérer ses 
marges sur chacun des espaces (F^,?^)^ w j ^ ; soit l P^ ces probabilités* On a : 

Vx t C , V», < <*, , VV - P x (B t x B*) 

VB 2 < s 2 , 2 P x (B 2 > - j ( P.CB 1 ; , B,) 

Oû {B*} (resp. {B. 1 } ) désigne une partition de F. (resp. de F 2 > 

engendrant (resp. î^)* 

P (B) étant une application mesurable pour tout B de $ » les applications 

*p (B.) (i*|,2) le sont aussi» comme sommes finies d * applications mesurables, 

• i ^ 

Ainsi % *P est une transition sur (E»£) x 

Vè nation 3 : 

Ou appelle T- codages iwiAge de P, Ica tAaïibiXioM P aoa (E#É) x ^t 9 
que pouA tout x de i, Ica lolA *P aua (F , £ 1 Aûienl le* maAgeA de P - 

JC -C A- 
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P.topt’i ifcûui ? 

La loi v codée, pa \ un T -codage, marge *P de P, cil la maAge de la probabilité 
codée de v peut P, s oit : 

' L lE v IP]j = Eyl'P). 

La démons t rat ion est évidente par interversion des signes de sommation. 


Codage pteduiX 
impie 

Si P l désigne un T-codage sur (E.,£.) relatif à et si $ est le semi-anneau 
des "rectangles 11 : 

* B 2 ^ | et C ^ 2 } * ° n l'application 

P « P 1 9 P 2 sur (E, % ) * S par : 

p . (e,£) xf ►([<), 13, §j 0J] > 

(x - (x r x 2 ),Bj x B 2 ) ► P * (B. x B ) - P 1 (B )xP 2 (B ). 

* fc X | I t 

Proposition 2 

P est un T-codage suA [E, Ê | Aelati £ à ^ . 


Démonstration : 

S' | ^2 finies , on peut décomposer tout élément de 5^ ^ © ^2 en 

une réunion finie d'ensembles minimaux deux à deux disjoints et ainsi définir P 
sur E * 

Soit : 

p x < B > * P_( « b) * BÎ) - E P (B* x B*) 
i»l 1 1 i=l x 1 2 


" E P x (Bj).pj; < B J)- 
i= I I 1 2 2 


D’autre part, pour tout B de Vf , l’application ; x ->■ P (B) est mesurable comme 

x 

sonne finie d’applicat ions mesurables. (J 


ProduitdcA maAqCA 

Si *P est un T-codage sur E relatif â 
Vx c E, VBj x B 2 t 5 . P x (B f x B 2 ) - 


'w • 2 W 

('P • 2 P) X (B, * B 2 ). 



72 


P eül de même un T-codage appelé codage produit de ses marges. 


Reniai juc 

Si Gard E^ = p , Gard * q et si les tribus SF ^ et sont engendrées 
par des partitions de cardinaux respectifs r et s» on voit alors que la défini- 
tion d'un T-codage sur E relatif à nécessite la connaissance (ou du moins dans 
la pratique l'estimation) de p q r s termes. 

On aura donc tout intérêt à se ramener* si cela est possible» à des codages 
produits plus s impies , puisque : 

* pour le produit simple* il suffit de connaître pr ♦ qs termes. 

* pour le produit des marges* il suffit de connaître pq(r+s) termes, 

3 - ANALYSES ET T- CODAGE S 


3.1 - Rappels et notations 

L'A.F.C, peut être introduite de différentes manières équivalentes entre 
elles. Nous en utiliserons deux au cours de cet exposé ï 


\naLijtc canonique. (A.C.) d'une pnobabitiXe àWt un espace produit 

Soit (Xj.X^) un couple de v,a. défini sur (fl, CL, p) et è valeurs dans 
CE | * ^ 2 ^* ^ ^ 2^" ün d ^ s ^ê ne P ar (k"l *2) les tribus complétées de 

— 1 'j, i j 

X. (v L ) et, respectivement* par{a,j. . et(ai}. , les partitions finies 

“ I l a I | « * t |P Z J^I t » * * 

de fl qui les engendrent. On pose : 


P j j ~ U (üj 11 a^) 


P 


- j 


q 

z 

i-i 


ij 


p 

£ 

i»l 


U 


U <aj) 


On note p x *= x ^ l'image de p par (Xj ,X 2 ) sur (E| x E^, ïj ® Ü 2 ) * 


Jiy et jj ses marges et X le produit g • n 
I *2 X I X 2 


Vjj admet relativement à X une densité qu'il suffit d'expliciter sur les pq 
modalités ({xj} x (xj)) de (Xj ,X 2 > } 


d P, 


(x,,x 2 ) 

~dX 




({*î) x {xD> • 

ü(a, ) . u{a:) 


LL 


p . /p . 
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On sait (cf. J. DAIWHS et A. POUSSE (.4 1) que L’A.F.C, de (X ( ,X 2 > peut 

alors être définie comme l'A*C- de U v . Elle est obtenue par l'analyse spectra- 

XX ^ 

le de l* opérateur E ' • E 2 /l 2 (<X, j otl 1 ' on a : 


a i ? 

E 1 : g t l/<a 2 ) 


2 : f e L 2 (^,) 


T 

X, 


n 

z 

fü 

s(j) 

j-i 

p i. 


p 

P- ; 


l 

i = ! 

_U 

P -j 

f(i) 


où f(i) (resp. e< J> ) désigne la valeur prise sur «J (resp. a ^) pour i=!,...,p 
(resp. j- I , - . . , q) . 

Ces opérateurs ont pour matrices, relativement aux bases (U ;} . , et 

"Tïj i=l P 

a Œ i> jŒ| de L 2 (ft,) et L 2 (Q 2 ), respectivement D| 4 et D 2 *4, oïl T est la 

matrice de terme général p et D (resp. D ) la matrice diag( p . ). 

(resp. diag(P ) ). 

* J J 3 ^ i * * • »<! 

L A.F*C. est alors obtenue par l'analyse spectrale de la matrice : 
d“' T D 2 ‘ 4. 


A.F.C, en tant qu'A.C.P. 

Si on note encore (on confond les notations par souci de simplification) : 

X | n et X ? = 1 -ïï„ j J ï _ * „ les paquets d'indicatrices» une 

* w | 1 1 ■ »p * J - l » • • * »q 

façon plus classique d'introduire l'A.F.C. de (Xj,X 2 > est de la définir (cf. 

par exemple CAZES et ail. C 3 J > comme l'Analyse en Composantes principales (A.C.P.) 

du tableau Z = ^Ij obtenu èn superposant les deux paquets d'indicatrices. Le 


schéma de dualité associé s’écrit : 

Z - 


R P+ V 


i ecn 

h 


H 


>P +l l 


L 2 (îî, ,,j) =,K n 


D » - I 
n n n 


L (tî, ,p) 


oïl V 


rv 

n 

V 



rv*' 1 

n 

o * 



et 

M » 

V 22J 

- V 2. 

V 22- 



0 

L 


avec V. . - X. D X. , 
ij î n j 



Cette A.C.P. est obtenue par l'analyse spectrale de l'operateur W * 
représente par la matrice : 


t 



1) + 
n 


<x 2 '‘n h 


D 

n 


3.2 - A.F.C. codée 


lu taodtic £<0»l 

J. F. MARTIN tûJ a déjà décrit quelques applications du T-codage (ou codage 
flou) aux analyses factorielles (A.C.P. d'une probabilité codée» A.C. non liné- 
aire d'un couple de v.a. codées . ..) permettant entre autre d'introduire dans le 
modèle des notions d'erreurs de mesure» d'arrondi» ou encore de lissage de va- 
riables quantitatives. Un autre type d'application est proposé ici* concernant 
cette fois tes variables qualitatives et donc 1 'A.F.C. . Il permet de tenir 
compte des erreurs de classement des individus à l'intérieur de chaque modalité 
ou encore d'estimer l'analyse de la v.a* Y "coûteuse" à observer par l'intermé- 
diaire d'une variable X plus facilement accessible. 

A.C. T-codée d'une pi obabitLti 
tcou 4 : 

Soit v une p\obabitite. 6ttn JEj * ® ^ g) zt un T-codage Aetatifa 

a ^ , on appeffe anatyAe canonique T-codée de v, -t'A.C. de ta toi 

E^|/ 3 l 4 ai E’eipace ( F | * 

A.F.C. codée d'un ccupfe de v.a* 

De même, si X = (X^X^ est une v.a. définie sur (ft»t)-*p) à valeurs dans 
(b j x E 2 » ^ ô muni de la loi image p^ de p par X» on a : 

Vé finition S : 

Si P eàt un T-codage 6u/i (Ej x Aelatlfa d & j © <3* on 

appette A.F.C. T-codée de X» E'A.C. de ta toi E IP| Au* i'edpace p*odact 
(Fj x F 2 , ^ | © Çp ♦ 

Remarque : 

” "* | 2 

Si P et P désignent les T-codages marges de P, cette analyse est obtenue 
à partir de l'explicitation de la densité : 
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d V p x> 


dE (P) 

IJ 


d( 'yV * 2 e „ (p x )J <' p > • <2p > 

X X 


3.3 - m-A.F.C. codée 


Vz^inLtion 

Une généralisation possible de l'A.F.C. à plus de deux variabLes qualita- 
tives s'établit à partir de la définition donnée en 3.1. 

Considérons m variables ayant chacune p^ modalites, on est conduit au 
schéma de dualité suivant : 


m 


K 


Z 
i = I 

* 


<- 



L 2 (Q t a,p) - 

I 4V 


M 


V 


m 


* 

R 


Z 

i=l 


t 


Z 



I /n I 

n 


où V 





avec V, . 


X. D t X. et H = diag(V.l). , 
i n î n'i = l 


L’ 

t 7.MZD 

n 


analyse cherchée est alors obtenue par 
ou encore par celle de l'opérateur H « 


l 'analyse 
V. 


spectrale de 


1 'opérateur 


Remarque : 

Dans ce type de généralisation de l'A.F.C.* seuls interviennent les tableaux 
Vjj croisant toutes les variables deux â deux ; c'est-à-dire qu'il n'est pas 
nécessaire de connaître la loi de X = ) sur toute la tribu 

*£| 0 — ® • mais seulement ses "marges d'ordre deux". 


m-A.F.C* codée 

La notion de T-codage sur un espace produit introduite en 2.2 - se généralise 

sans difficulté à plus de deux espaces ; on obtient encore une transition sur 

(E * F * ... « E f -(*, • ... »'% ))„ ( <T, • ... .9" ). 

1 m I m ' I m 
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D'autre part, compte tenu de la remarque précédente» la m-analyse ne né- 
cessite que la connaissance des "marges d'ordre deux" de la loi E (P) pour 
le calcul de la densité» soit : 

V(i,j) f [I ui} 2 , lj tE (P)] - E ( lj p) 

(propriété analogue à la proposition 1) 

et donc il suffit de connaître les T-codages marges l ^P sur (E»^) relatifs 

à ff. • Q . . 

a 1 j 

A - APPLICATION AU PROBLEME CONCRET 


A. 1 - Codage conditionnel sur un espace produit 


Pûbitœn du l'iobtb ne 

On souhaite étudier une variable Y inobservable» ou trop coûteuse à obser- 
ver» à l'aide d'une variable X facilement observable mais entachée d'erreurs 
aléatoires (non nécessairement indépendantes ou additives). 11 est alors impos- 
sible de déterminer une fonction de transfert de X en Y, mais on suppose connue 
(i.e., par exemple» estimable sur un échantillon-test) la loi de probabilité 
conditionnelle de Y à X qui permet de déterminer» par l'intermédiaire du codage» 

la loi de Y connaissant celle de X (E (P) B p cf* 2.1). On peut ainsi calcu- 

U X ï 

1er 1 A.F.C. de Y = nc dépend É l ue de Uy 


le r-codatje candi tionmt 

Dans le cas qui nous intéresse» les variables qualitatives X et Y sont des 
couples et ont un nombre fini de modalités. Soit donc E * Ej x et F 5 Fj X ^2 
avec : 


E, a {x|/i f. I = {l,...,p}} 
E, “ (y^/k e K - {I r}) 


e 2 “ £ J “ U..*»tq)ï 

F 2 “ (x^/fc « E ■ { 1 > — ,s)}. 


On définit alors le T-codage conditionnel de Y en X par 

tç 

V(i s j»k,£) t I x j x K x L 


♦iJH ' P (»j.xj) ((lr l 1 11 ‘'Z» 

- vi «, ,ï 2 )-(y | >» 2 )/(x l ,x 2 )-(»j ,xj ) 1 
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et la fonction de codage se met sous la forme d'une matrice : 


‘♦ijni’ 


(k,£)cK*L 


^ i jk£, exprime encore la probabilité de bon ou de mauvais classement 

c’est la probabilité que Y(w) prenne la modalite (y^,y5) sachant que X(o>) 
; ; 12 


est observée en (x^x^). 


Hijpoth£*>z& de zimptL&i cation 

On a vu en 2.2 - que l’on pouvait diminuer le nombre de termes 3 estimer 
pour déterminer le T-codage P en l’exprimant sous la forme d'un produit. Afin de 
simplifier les notations on pose : 


a | & X j({ x "|î)* a 2 = X 2 tt x 2^ » = ^Uy^}) î ^2 = Y 2 ( { y ^ 1 ) , 


et ainsi : 


* 


ijk* 



n P 


2 / 


i 

ot^na 



Considérons alors les hypothèses suivantes (valables pour tout (i,j,k,£) 
de I x J x K x L) : 


(H,) 


..reï » ej, 


] = 


l J 

°l na 2 


^ï/ 


t j 

V a 2 


0« 2 ) 


r . 1 


1 J 

a ( na^ 


et 


Ut6 


2 / 


J 


V 


i j 
c^noej 


•**1/ . ] 
“î 


UCB 2/ ,1 


Pfiopoiltion 3 

U J (fl fl < r ^> P * *P • 2 p 

UÂ.) (rf f J et {H ? J <— > P = p } s P ? 


ufB 


2 / 


i 

a jOa 


t 

j 

2 
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Démonstration : 

(i) En explicitant, 


p ** Vx € E, VB c 'S P (B) “ ^P (B.) - P (B_) 

X XI a £ 


< -> V(i,j,k,£) e IxJkKxL pIBirtfij/ 3 “ mCBjf 3 * ^^2/ ^ 

JJ * J AJ 


d|nci2 


V a 2 


ajnctj 


< > (H,) 


{ii) Supposons (llj) et (Hj) » alors : V(i,j,k,£) £ IxJxKxL 

P/ i 1- pte^ 3 . .3 

* * I » *2 * 1 * ii i J 

■ « rtn.J r* n J 


a^na^ 


i 


P ij ({ ^ } > - P îj«*î» 


1 2 

Réciproquement* si P est égal à P • P on a 


Vx e E , VB e 


P x (B) - F^.,) • F^<» 2 ) 


en prenant x = (xj.x^) et successivement B - {y , ) * Fj et ® “ F | X ° B 


obcient 


puis en prenant x = (xj.xj) et B - {y^ } x (y*) et en utilisant <H 2 ) , on obtient 


(H,). □ 


Signification de.6 htjpu thè4&6 

{H^ ou [ (H j ) et (1I 2 )J sont des hypothèses d'indépendance conditionnelle 
permettant de simplifier l'expression de P. 

En écrivant les variables sous la forme : 

Y- - ^(X^E^) pour i= 1 ,2 , 

où tb. est une fonction mesurable et e. une v.a. "mesurant” 1 erreur, on remarque 
r i i 

que les hypothèses signifient : 

«(Hj) : Xj et X 2 étant connues, Yj et V 2 sont indépendantes ou encore, les 
erreurs de mesure (ou de classement) sont indépendantes entre elles. 
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* { H I ) et (H^) ; Xj et X£ étant connues ; pour 1=1,2 , 


ou encore, e. est indépendante de 
dantes entre elles. 


la valeur de X. . et 
3-i 


Y. 

1 

f; 


ne dépend que de X. 
et £ ^ sont Lndépen- 


4 + 2 - Détermination pratique de l'analyse 


lxplic,Uaiion cfe la 

Connue il est décrit en 3.1 - f le calcul de l'analyse de Y ne nécessite pas 
1 'observation de Y, mais la connaissance de la loi de Y et, plus précisément, de 
la densité de cette loi par rapport au produit de ses marges dont l'existence 
est assurée car E et F sont de dimension finie, 

L expression de cette densité est plus ou moins complexe suivant les hypo- 
thèses qu il est possible d’admettre# 

Posons : 

P ij “ V U Î } * fx 2 )} ” W(a i n °2>* 

avec pour marges p. et p . et : 

i . . j / 

q k* = * lyjî) - P<6* n B*) 

avec pour marges q fc et q . 

La densité s'exprime alors : 


«Æp^P) 

d[E ( X P)9 E < 2 P )1 
X 




M kg 

q k. Xq .* 


i ^ jk£ j 




z „ p. * 

: j IJW K 1 J 

*»3 

( Z *ttlr »P; *>*( £ 3 P* • ) 

i,j 1 J k - £ JJ *J-4 u 


où, par analogie. 


*ijk. 


1 *î ÏVt et <*>; i t " E 
l-| ijk*. Îj.t Jc _ | Îjkl 


Avec les mêmes notations on a la : 
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Proposition 4 

U) 


df IP] 


J 2 

p = WP -> 


1 


dLf l'PK ( PH 

" V * 


J- UyMyZ J» ^ 

* m -i • *■ 


^ Ptj 


ij j ^jfe- P ^i ***'•* P *J* 


Ut J P « P f «>P 2 -> 


dt |P} 

y x 


d£ IPI 
U X 


dE |PJ 
P X 


d( £ t 1 P) ®E [ 2 P|] d[E |P f )®E |P 2 |1 dE 

M x M x u x M x 


^*x ®x 
A r A 2 


IPI 


Démons trat^i on : 

(i) Evident 

(ii) Si P est de la forme P* ® on peut poser : 

K k 1 j 2 

^ijk£ ^ik * 
et remarquant que : 

r | 3 2 

V(i J) € I x j , E <f = 1 et £ * - I, 

k = l K £-1 


il vient alors 


dE (P) 

l x 


d[E {^JôE ( 2 P)J 




E *!. * 2 p. . 

. . îk T j£ *ij 

ii-L — — _ — ■ ^ 

i j 


_Lii 


*ik ^ j £ P ij 


v J <*. 2 

. Z . *ik *jt P i. xP .j 


□ 


A* F. C. de |V r y 2 ) 

On cherche donc l'A.F.C. de Y connaissant X. Pour ce faire il faut calculer 

1 * A. C. de E (P) qui est la loi de Y 61 P est le T-codage conditionnel. En fait 
a 

les calculs - présentés ci-dessous sont valables pour tout T-codage P pourvu 

12 

qu'il se mette sous la forme élémentaire : P “ P fl* P (le codage de X est égal 
au produit des codages de Xj et X^) ; c'est-à-dire, dans le cas du codage condi- 
tionnel, si les hypothèses ( Il ^ ) et (Hj) sont vérifiées. 

On note : 
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C étant la table de contingence associée à X, C* est celle associée 3 Y et 


s écrit aussi : 


C* - *. C *2 


Le schéma de dualité associé ù l’A.C. de E^ (P) (équivalente à l'A.F.C. du 
couple (Yj.Y^)) est le suivant : ^ ' 




A k 

F P « L 


« X -> 

B" t ^ 

* 

D “Y 1 
n n n 


i-».' 


2 s 

> ® 


1 „n "2 

>» 




où N. - diag[(E (‘pxty^})) ’l , 

1 M x l k- I , . . . ,r 

et N 2 - diag[(E < 2 P)({yJ)» -, 3 

*■ 1 I ^ 4 • I ^ $ 

L A.F.C. cherchée est obtenue par l'analyse spectrale d’un opérateur ayant 
pour représentation matricielle : 

"l *1 *! D n '*2 S »2 *2 *2 D „ ‘*1 * ", C « 2 V. 

En pratique, et ce quelles que soient les hypothèses admises, il suffit donc 
de faire exécuter un programme classique d'A.F.C. sur le tableau C' de terme 
général q^ . 

Sous les hypothèses (H|) et (H^) , cette matrice 9 'exprime simplement par : 

*1 C *2 * L ’ anal y se obtenue est équivalente à l'A.C.P. du tableau : 


*1 

0 “ 


V 

0 

4> 

X 



2 J 


1.2 J 


les espaces étant munis des métriques Nj et 
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Remar^uej : 

Dans le cas très particulier où , et t [p({x^))J. . 

I i=l,. ...p 2 

sont respectivement vecteurs propres associés à la valeur propre I des matrices 
^$1 et » J. F. MARTIN [8] a montre que était invariante par P, i.e. : 

‘ E^(P) = m x . 

Dans ce cas» et dans ce cas seulement» les analyses de X et de Y sont les 
memes, et nous dirons que l'A.F.C. de X est invariante par P. 

Remargue_2 ; 

On peut appliquer cette méthode aux processus prévisionnels. 

Dans l'hypothèse où X^ et X^ sont des chaînes de Markov de matrices de tran- 
sition et , le point de vue adopté ici rejoint celui de A. YOUSFATE [13] : 
connaissant l'état initial de (X^.X^)» on peut calculer les A.F.C. aux différents 
ins tant s . 


4.3 - Cas de l'A.F.C. généralisée 

Position du pxobtème 

On se propose de généraliser ce qui précède à la situation suivante : soit 

Y = (Yj,...»Y ) une v.a. définie sur à valeurs dans (F ■ F| x ... x t 

^ ^ . ® ... © 5 ) et X * (X,,...,X ) à valeurs dans (E - E, x ... * £ , 

_ 1 m l m 1 m 

E * « ... ® % ). Soit pour tout i. Card E. - p. et nous utiliserons la 

I m i r i 

définition de la ia-A.F.C- codée donnée en 3.3 . 

Cette analyse ne pose pas de problème théorique spécifique mais rend encore 
plus délicate la mise en oeuvre pratique à cause de la multiplication des hypo- 
thèses à considérer. 


Htjpothè&eA de ^impLi^icatLon 

Comme l'analyse de Y ne tient pas compte des relations (interactions) inter- 
venant entre plus de deux variables» elle ne nécessite pas la connaissance du 
T-codage conditionnel P, mais seulement celle des marges 1 ^P et donc une hypo- 
thèse du type de (H.) n'est plus nécessaire. 

1 . 2 

On cherche donc à simplifier l'expression des m transitions : 


IJ 


P : (E,t ) x <3^ • ) 


U. B..) 


► 'no, n , ® r0t ,-|> 

ijp x ( B|j) - ** * 



5 - ESTIMATION DU CODAGE ET CONVERGENCE 


5. 1 - Estimation 

En pratique, la loi conditionnelle de Y à X est inconnue et il est alors 
nécessaire de 1 estimer sur un oclianti 1 Ion— tes t . Pour simplifier les notations 
nous considérons X et Y au lieu des couples <X |f X 2 ), (Y |f Y ) et nous noterons 
* = < au lieu de 1a de codage. 

On suppose que Ton observe un échanti 1 Ion- tes t (X, ,Y. ). de (X Y) 

k k k-l , . . . ,m * 7 f 

puis un échantillon * =m+ j m+ïi de X, indépendant du précédent. 


Si M.^ désigne l'effectif de la modalité (x. .y^) de la variable (X t Y) pour 
1 échantillon de taille m et l'effectif de la modalité x. pour l'échantillon 


de taille m+n, l'estimateur du maximum de vraisemblance de 


[ 8 ]) 


s exprime 


m 


♦ik - *î k - 

1 




° ( VV 


h-i 


1 lf'* I * X h 
h=i 1 i' h 


0 si. 


c 'es t-à-dire 


M. 


*ik 


ik 


M. 


M, +N. 

L'estimateur de u est alors : ]» v ({x.}) * — — „ 

* X i m+n 


ik 


m 

si Z 
h=l 


(x. } 


(voir J. F. MARTIN 


"h 


i* 0 


Ces deux estimateurs permettant de construire celui de la loi de Y : 
P - I P 

1 *ik J> = zr- E H.. „ 

ik X i m+n . ik M. 

i=*l i . 


l f Y (( y k }) 


i = l 


H. +N, 
1. 1 


5*2 — Convergence de T— codages 
PoA-tXtûM cfu p'tobfème 

Soit P un T-codage sur <E,£) relatif 3 et (X ) une suite de v.a. 

. n neTJ 

e mies sur à valeurs dans (E,^£), indépendantes et de meme loi que X. 

* 

our tout n de H , (X|,-.. t X n ) est un n-échantil Ion de X auquel on peut associer 

le n-uplet de probabilités de transition (P x , . . . ,P ) appelé échantillon T-codé. 

t • 1 n 

^ On c intéresse donc à la convergence, en un sens à préciser, de la suite 

*n P X. ) nd^* des moyennes empiriques des échantillons T-codés vers la pro- 
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De plus» comnt le T-codage P est lui^même estimé t il faut étudier la double 
convergence de la suite 

n 

( Z 

i = l 


Convergence vague, et convergence faibte 

Soient P et (P™) * des T-codagea sur (E.'&^v) relatifs àf. On peut définir 

mtU 

comme le fait J. F, MARTIN [83 une "convergence vague V “Presque sûre (v-p.s.) ,r . 


) 

X. 

1 -1 


(m*n)*N 



Définition 6 : 

On dit que. ta conveJl â^ vagument v-p.6* vête P Si pour tout 

B de Sr ta suite de v.a. (P®(B|Ï conueAge \rp.A. ver* tav.a. P(B], l.e. : 

(J) VBeCP v{ x £ E/tim * P (8|J - I. 

m+*a> 

Généralement (I) est moins exigeante que la propriété ; 

(2) v{x £ E/VB e QF lin p"(B) - P (B) J - i. 

0»+co 

Cependant, ici SF étant une tribu finie, il esç clair que (1) et (2) sont 
équivalentes. On utilisera donc (2) et on a la : 

Définition 7 : 

(F 01 ) _ * converge faibtement v-p.4. vers P si pour presque tout x de E 

nît'W 

ta suite de probabilités IPx^jj* converge feûblment vers P x U.e. (21). 


Remarque : 

Nous utilisons la notion de convergence faible puisque, «î* étant finie, 
les indicatrices] sont continues. 


5.3 - Convergence de ^analyse 


Convergence du T- codage conditionnez 

En reprenant les notations de 5.1 le T-codage conditionnel est déterminé 


par : 


P, «y k )> ! [ l ly ) •* * ; 
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Soi t 


(»ij> 


»j 


P (B. .) = Ui;v « B. . ,, 

X IJ ij/(X.,Xj)=(x. 


Xj) 


Ce sont des hypothèses du même type que (H*) permettant de définir Jn tran- 

sition P seulement sur l'espace E. x E ^ au lieu de E tout entier. Sommairement 

(H..) signifie que l'erreur conroisc sur la "mesure" de (X.,X.) est indépendante 
* 1 J 

des valeurs prises par les autres variables X fc (ki*i et k/j). 

Ainsi si pour tout couple (i.j), l'hypothèse (H..) est vérifiée, le problème 

2 l J > y 

se ramene alors 3 m fois la situation précédente de l'A.F.C. d'un couple de v.a 

Pour chacun des couples (X-, X.), on peut considérer les hypothèses (11!-*) et 
ij 1 J I 

0*2 ) colmn e définies en 4.1 - et évaluer alors : 

VJ . = E ( l jp) 

13 V X 

(dont la simplicité relative dépend de l'admissibilité de (h| J ) et 


m-anajttjàz 

L'ensemble de ces blocs permet de construire là matrice 3 diagonaliser : 


M’ “ V’ 


11 

0 


/'-'I 

rom 


fv.'.l 

L 1 d(i t j) Cl ' 


Sous le jeu complet des hypothèses : 

V(i,j) € l 2 (H. j) A ( H j j ) A (njj> 

et en se référent au paragraphe 3.3 - , on obtient le schéma de dualité : 



oil V' - ♦ V . 

Ce schéma correspond 3 l'A.C.P. des variables (* ( X ( $ X ) lorsque 

l'espace des "individus" est muni de la métrique M*. 
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codage que l ‘on peut, estimer sur l 'échanti lion-test (X. ,Y.) { . par 


1 * si I 


P ({y. >) 

x* k 

î 


J hl i . iC 

J j 


/ 1 • X. * 0 

j-l lx i> 1 


* 1 \ * J 

j~l 1 


0 sinon. 


Les tribus et ÇT étant finies, la suite de probabilités (P m ) * converge 

x nui 

faiblement vers P^ uniformément en x sur et on peut donc appliquer la propo- 
sition 6 p. 74 de J. F. MARTIN T8] montrant ainsi que : 

1 n 

lim — Z ■ E (P v ) faiblement p-p.s. 

n . _ x. u X r 

ro++ OT i=J i 

Convergence de VanaLyàt 

En utilisant le résultat ci-dessus pour X = (X^X^) et Y * on P eut 

appliquer la proposition 9 p. 291 de J. DAUX01S et A. POUSSE £4], On en déduit 
la convergence uniforme p.s. de la suite des analyses obtenues par échantillonna- 
ge vers celles de Y et ainsi , la convergence des éléments propres (valeurs pro- 
pres et facteurs canoniques de l'analyse) * 


6 - CONCLUSION 


Les outils développés permettent donc bien de résoudre théoriquement le pro- 
blème concret posé en El]» En pratique il faut être conscient que les difficul- 
tés dues à l'estimation de la probabilité de transition sont délicates à trai- 
tées, On a vu que pour simplifier ces questions il fallait pouvoir décomposer 
le codage P en un produit de ses marges, ceci ne peut se justifier alors que 
par la considération d'hypothèses de type probabiliste. Ainsi apparaît la né- 
cessité d'introduire des outils adéquats (probabilités de transition) pour 
modéliser la notion de codage dans le cadre des analyses factorielles non-li- 
néaires. 

D'autres types d'application que celle proposée en [I] peuvent être suggé- 
rées. 11 est fréquent de vouloir réactualiser une enquête ou un sondage sans 
pour autant interroger un échantillon complet. Il suffirait alors de ne réen- 
quêter qu'un eous-échanti lion de l'échantillon initial permettant d'estimer une 
probabilité de transition et donc, d'actualiser les représentations factorielles. 
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Dans un mitre ordre d'idée, on considère les hypothèses proposées par YOUSFATE 
15 (chaîne de Markov homogène d'ordre I) dans le but de prévoir un processus 
qualitatif. Alors, connaissant les transitions de 2 ou plusieurs de ces processus 
on peut prévoir les représentations factorielles (A-F.C. ou m-A.FX.) associées 
à ces processus. 
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